iT邦幫忙

2022 iThome 鐵人賽

DAY 28
0
AI & Data

機器學習的 hello world - 用手寫數字辨識系統學習 ML 的 30 天系列 第 28

[DAY28] 為什麼要學機器學習?從數據分析成熟度模型來談ML跟數據的關聯

  • 分享至 

  • xImage
  •  

最後三天讓我們來聊聊未來方向吧!


當我們踏入機器學習的領域,學了很多機器學習的方法(特別是跟神經網路有關的方法),但在一般企業裡或實務上卻發現好像用不到,或發現用統計、決策樹和 if-else 判斷似乎就能解決大部分的問題時,很容易冒出了我學機器學習或學這麼多方法到底在做什麼的想法。

這邊我想從數據的角度來講這樣一個狀況。前面學機器學習時,是從有什麼方法、這個方法的意義用法角度來解決問題,所以並沒有對數據做太多的前處理或探討。

但現實生活中,我們更多是從資料出發。機器學習是一種方法,我們了解其優缺限制後,即可選用合適的方法解決問題,但更多時候我們會需要對資料做清洗前處理等,好的資料處理可以避免 garbage in, garbage out,選用好的數據也會比調整參數更具成效。


數據分析成熟度模型(Data Analytics Maturity Model)

https://ithelp.ithome.com.tw/upload/images/20221012/20131719Fx9pca6lsL.png

圖片來源:從Gartner的數據分析成熟度模型來談,從數據分析進階到商業智慧該做些什麼?

這是一個描述企業對數據分析運用成熟度的模型,它分成四個階段:

  • 描述性分析(descriptive analytics):描述數據結果(what)
  • 診斷性分析(diagnosic analytics):診斷數據結果原因(why)
  • 預測性分析(predictive analytics):利用數據預測會發生什麼(what-than)
  • 指示性分析(prescriptive analytics):我們要怎麼做才能產生或避免預期的風險(how)

通常在預測性分析和指示型分析之間,還會加入條件性分析,目的是為了模擬可能的情況跟風險評估(what-if)
從Gartner的數據分析成熟度模型來談,從數據分析進階到商業智慧該做些什麼?

前半部偏向現況分析,多用統計等好解釋的方法來描述情況,後半部是對未來的假設預測,也是目前機器學習的運用方向。價值跟困難度會隨階段而提升,大家都是在轉型成長當中。


機器學習的過程就是在找一個函式(function),讓機器有能力根據我們提供的數據資料,找到我們想要的結果。明天我們會來聊聊會手寫數字辨識後,可以往哪些方向繼續學習或累積自己的履歷。

我們明天見!


其它-Azure Machine Learning Studio

今天本來要用 Azure Machine Learning Studio 這個工具來講數據對機器學習的重要性,結果這個月發現 Studio 的部分停止更新維護了…新版的微軟機器學習相關服務-Azure Machine Learning,因為功能更多,在設定操作上比較複雜,過程中要解釋軟體部署(Software Deployment)概念,所以後來就先跳過了。不過想要了解 Azure Machine Learning 的人可以從在上面建一個手寫數字辨識系統服務開始,官網上有框架用 CNTK 的教學。

https://ithelp.ithome.com.tw/upload/images/20221012/20131719KVrXC2ho5j.png

Azure Machine Learning Studio(classic) 的操作介面。圖片來源:【人工智慧線 02】機器學習新手入門工具 Azure Machine Learning Studio


上一篇
[DAY27] 線上程式編輯環境-Google Colab 介紹
下一篇
[DAY29] 會手寫數字辨識系統後,可以往哪些方向繼續學習呢?
系列文
機器學習的 hello world - 用手寫數字辨識系統學習 ML 的 30 天30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言